Dado un espacio métrico \((U, d)\), la idea es preprocesar un \(X \subset U\) para resolver consultas \((q, r)\) de manera eficiente.
El preprocesamiento tiene como objetivo obtener relaciones en el espacio métrico para permitir resolver consultas de manera eficiente.
La búsqueda por similitud es un problema fundamental en ciencias de la computación, pero es importante remarcar que las aplicaciones con los nuevos modelos de aprendizaje profundo se estan consolidando aún más.
UMAP de primos
Ejemplo Clustering/tópicos – Unidad 6 Recuperación de Información
Entre las aplicaciones posibles, no siempre se necesita un índice (preprocesamiento)
Similitud léxica entre regiones
Similitud semática entre regiones de México
Entender el lenguaje y los mensajes escritos en redes sociales.
Minería de opinión (análisis de sentimiento): determinar sí algo es positivo :), neutro :), o negativo :(
Análisis de tópicos: ¿Qué temas hay en un corpus?
Carga emotiva de un mensaje: enojo, anticipación, disgusto, miedo, gozo, tristeza, sorpresa, confianza.
Identificación de humor, odio, o esperanza, …y un largo etcétera.